8 research outputs found

    Automatic speech recognition with deep neural networks for impaired speech

    Get PDF
    The final publication is available at https://link.springer.com/chapter/10.1007%2F978-3-319-49169-1_10Automatic Speech Recognition has reached almost human performance in some controlled scenarios. However, recognition of impaired speech is a difficult task for two main reasons: data is (i) scarce and (ii) heterogeneous. In this work we train different architectures on a database of dysarthric speech. A comparison between architectures shows that, even with a small database, hybrid DNN-HMM models outperform classical GMM-HMM according to word error rate measures. A DNN is able to improve the recognition word error rate a 13% for subjects with dysarthria with respect to the best classical architecture. This improvement is higher than the one given by other deep neural networks such as CNNs, TDNNs and LSTMs. All the experiments have been done with the Kaldi toolkit for speech recognition for which we have adapted several recipes to deal with dysarthric speech and work on the TORGO database. These recipes are publicly available.Peer ReviewedPostprint (author's final draft

    The TALP–UPC Spanish–English WMT biomedical task: bilingual embeddings and char-based neural language model rescoring in a phrase-based system

    Get PDF
    This paper describes the TALP–UPC system in the Spanish–English WMT 2016 biomedical shared task. Our system is a standard phrase-based system enhanced with vocabulary expansion using bilingual word embeddings and a characterbased neural language model with rescoring. The former focuses on resolving outof- vocabulary words, while the latter enhances the fluency of the system. The two modules progressively improve the final translation as measured by a combination of several lexical metrics.Postprint (published version

    El català i les tecnologies de la llengua

    No full text
    El processament computacional de la llengua abraça qualsevol activitat relacionada amb la creació, la gestió i la utilització de tecnologia i de recursos lingüístics. En el pla científic, aquesta activitat és central en disciplines com ara la lingüística de corpus, l’enginyeria lingüística o el processament del llenguatge natural escrit o parlat. En el pla quotidià, s’inclou en un ventall ampli d’aplicacions cada cop més habituals: sistemes automàtics d’atenció telefònica, traducció automàtica, etc. La gran majoria d’aquestes aplicacions requereixen eines i recursos lingüístics específics per a cada llengua. Per a llengües amb un mercat ampli, com l’anglès o el castellà, l’oferta de productes i serveis basats en tecnologia lingüística és variada i habitual. Per al cas de llengües com el català, és més difícil trobar productes i serveis que s’ofereixin ja «de fàbrica» amb aquesta tecnologia. Aquest article presenta una panoràmica de l’estat actual de les tecnologies de la llengua per al català, com també diversos aspectes que avui dia es debaten en el si de la comunitat científica dedicada al processament del llenguatge natural parlat i escrit

    El catalán y las tecnologías de la lengua

    No full text
    El processament computacional de la llengua abraça qualsevol activitat relacionada amb la creació, la gestió i la utilització de tecnologia i de recursos lingüístics. En el pla científic, aquesta activitat és central en disciplines com ara la lingüística de corpus, l’enginyeria lingüística o el processament del llenguatge natural escrit o parlat. En el pla quotidià, s’inclou en un ventall ampli d’aplicacions cada cop més habituals: sistemes automàtics d’atenció telefònica, traducció automàtica, etc. La gran majoria d’aquestes aplicacions requereixen eines i recursos lingüístics específics per a cada llengua. Per a llengües amb un mercat ampli, com l’anglès o el castellà, l’oferta de productes i serveis basats en tecnologia lingüística és variada i habitual. Per al cas de llengües com el català, és més difícil trobar productes i serveis que s’ofereixin ja «de fàbrica» amb aquesta tecnologia. Aquest article presenta una panoràmica de l’estat actual de les tecnologies de la llengua per al català, com també diversos aspectes que avui dia es debaten en el si de la comunitat científica dedicada al processament del llenguatge natural parlat i escrit.Computer processing of language can be defined as any activity related to the creation, management and use of technology and linguistic resources. In the scientific field, it is a particularly important activity in areas such as corpus linguistics, linguistic engineering or the processing of written or spoken natural language. It is also involved in a wide range of everyday applications: automatic systems for telephone services, automatic translation, etc. Most of these applications require tools and specific linguistic resources for each language. There is an extensive range of language technology-based products and services on offer for languages with a wide market, such as English or Spanish. However, for languages such as Catalan, it is more difficult to find products and services that provide this technology. This article gives an overview of the current state of language technologies for Catalan, and highlights several aspects that are currently being debated by the scientific community involved in processing spoken and written natural language.El procesamiento computacional de la lengua abarca cualquier actividad relacionada con la creación, la gestión y la utilización de tecnología y de recursos lingüísticos. En el plano científico, esta actividad es central en disciplinas como la lingüística de corpus, la ingeniería lingüística o el procesamiento del lenguaje natural escrito o hablado. En el plano cotidiano, se incluye en un amplio abanico de aplicaciones cada vez más habituales: sistemas automáticos de atención telefónica, traducción automática, etc. La gran mayoría de estas aplicaciones requieren herramientas y recursos lingüísticos específicos para cada lengua. Para lenguas con un mercado amplio, como el inglés o el castellano, la oferta de productos y servicios basados en tecnología lingüística es variada y habitual. En el caso de lenguas como el catalán, es más difícil encontrar productos y servicios que se ofrezcan ya «de fábrica» con esta tecnología. Este artículo presenta una panorámica del estado actual de las tecnologías de la lengua para el catalán, así como diversos aspectos que hoy en día se debaten en el seno de la comunidad científica dedicada al procesamiento del lenguaje natural hablado y escrito

    The TALP–UPC Spanish–English WMT biomedical task: bilingual embeddings and char-based neural language model rescoring in a phrase-based system

    No full text
    This paper describes the TALP–UPC system in the Spanish–English WMT 2016 biomedical shared task. Our system is a standard phrase-based system enhanced with vocabulary expansion using bilingual word embeddings and a characterbased neural language model with rescoring. The former focuses on resolving outof- vocabulary words, while the latter enhances the fluency of the system. The two modules progressively improve the final translation as measured by a combination of several lexical metrics

    El catalán y las tecnologías de la lengua

    No full text
    El processament computacional de la llengua abraça qualsevol activitat relacionada amb la creació, la gestió i la utilització de tecnologia i de recursos lingüístics. En el pla científic, aquesta activitat és central en disciplines com ara la lingüística de corpus, l’enginyeria lingüística o el processament del llenguatge natural escrit o parlat. En el pla quotidià, s’inclou en un ventall ampli d’aplicacions cada cop més habituals: sistemes automàtics d’atenció telefònica, traducció automàtica, etc. La gran majoria d’aquestes aplicacions requereixen eines i recursos lingüístics específics per a cada llengua. Per a llengües amb un mercat ampli, com l’anglès o el castellà, l’oferta de productes i serveis basats en tecnologia lingüística és variada i habitual. Per al cas de llengües com el català, és més difícil trobar productes i serveis que s’ofereixin ja «de fàbrica» amb aquesta tecnologia. Aquest article presenta una panoràmica de l’estat actual de les tecnologies de la llengua per al català, com també diversos aspectes que avui dia es debaten en el si de la comunitat científica dedicada al processament del llenguatge natural parlat i escrit.Computer processing of language can be defined as any activity related to the creation, management and use of technology and language resources. In the scientific field, it is the most important activity in areas such as corpus linguistics, linguistic engineering or the processing of written or spoken natural language. It is also involved in a wide range of everyday applications: automatic systems for telephone services, automatic translation, etc. Most of these applications require tools and specific linguistic resources for each language. There is an extensive range of language technology-based products and services on offer for languages with a wide market, such as English or Spanish. However, for languages such as Catalan, it is more difficult to find products and services that provide this technology. This article gives an overview of the current state of language technologies for Catalan, and highlights several aspects that are currently being debated by the scientific community involved in processing spoken and written natural language.El procesamiento computacional de la lengua abarca cualquier actividad relacionada con la creación, la gestión y la utilización de tecnología y de recursos lingüísticos. En el plano científico, esta actividad es central en disciplinas como la lingüística de corpus, la ingeniería lingüística o el procesamiento del lenguaje natural escrito o hablado. En el plano cotidiano, se incluye en un amplio abanico de aplicaciones cada vez más habituales: sistemas automáticos de atención telefónica, traducción automática, etc. La gran mayoría de estas aplicaciones requieren herramientas y recursos lingüísticos específicos para cada lengua. Para lenguas con un mercado amplio, como el inglés o el castellano, la oferta de productos y servicios basados en tecnología lingüística es variada y habitual. En el caso de lenguas como el catalán, es más difícil encontrar productos y servicios que se ofrezcan ya «de fábrica» con esta tecnología. Este artículo presenta una panorámica del estado actual de las tecnologías de la lengua para el catalán, así como diversos aspectos que hoy en día se debaten en el seno de la comunidad científica dedicada al procesamiento del lenguaje natural hablado y escrito
    corecore